在艺术音乐生成中使用机器学习会引起人们对艺术质量的有争议的讨论,而客观量化是荒谬的。因此,我们将音乐生成的算法视为与人类音乐家的对手,在这种环境中,相互互动的相互作用是为音乐家和观众带来新的体验。为了获得这种行为,我们求助于经常性变异自动编码器(VAE)的框架,并学会产生由人类音乐家种植的音乐。在学习的模型中,我们通过在潜在空间中插值生成新颖的音乐序列。但是,标准VAE不能保证其潜在表示中的任何形式的平滑度。这转化为生成的音乐序列的突然变化。为了克服这些局限性,我们将解码器的正规化并赋予潜在空间,并具有平坦的riemannian歧管,即是欧几里得空间等均衡的歧管。结果,在潜在空间中线性插值会产生逼真而平稳的音乐变化,适合我们目标的机器 - 音乐互动。我们通过音乐数据集上的一组实验为我们的方法提供了经验证据,并为与专业鼓手的交互式jam会话部署了模型。现场表演提供了定性的证据,表明鼓手可以直观地解释和利用潜在的代表来推动相互作用。除了音乐应用之外,我们的方法还展示了由可解释性和与最终用户的互动驱动的机器学习模型设计的实例。
translated by 谷歌翻译